数据给经济学家带来新工具


哈福德:三项新发展意味着,经济学家们终于能够对人们如何处理日常生活事务进行细致、实时和大规模的观察。
大数据_经济学
如果好莱坞可信,那么古往今来每个科学家都有一个实验室,里面到处都是冒着泡的烧瓶、闪着灯的控制台和发光的魔球。科学作家菲利普•鲍尔(Philip Ball)(他曾参观过无数的科研实验室)告诉我,现实情况大同小异:装备可能没那么夸张,但总有装备。

科学依赖于工具,往往是专门的仪器,用于探测或衡量以往探测不到的东西——想想伽利略的望远镜或牛顿的棱镜。诺贝尔奖经常被授予开发此类工具的物理学家:云室(1927年)、电子显微镜(1986)、还有LIGO激光干涉仪引力波天文台(2017年)。

那么经济学呢?经济学也有自己的诺贝尔奖,但很难找到一个因开发此类新工具或仪器而被授予奖项的个案。西蒙•库兹涅茨(Simon Kuznets,1971年诺贝尔经济学奖得主)也许是这方面最有资格的,因为他发展了衡量国内生产总值(GDP)背后的思想。可惜,GDP是一个广义的总量,库兹涅茨深知其中的局限。

伟大的阿尔弗雷德•马歇尔(Alfred Marshall)将经济学描述为研究“日常生活中的”人性。不幸的是,在马歇尔所处的时代(他于1924年去世)根本没有办法观察人们如何处理日常生活的事务,或许除非作为一位人类学家。那时的经济学家花很多时间坐在沙发上,认真思考理论而不是去衡量。

当代一些经济学家使用其他领域的旧工具取得了一些进展。麻省理工学院(MIT)的艾斯特•杜夫洛(Esther Duflo)是著名的约翰•贝茨•克拉克奖(John Bates Clark Medal,俗称“小诺贝尔经济学奖”——译者注)的获得者,他使用随机对照试验(RCT)回答经济问题。典型的RCT试验可以追溯到奥斯汀•布拉德福德•希尔(Austin Bradford Hill)在1948年对链霉素治疗结核病进行的试验。

但终极目标是能够对人们如何处理日常生活事务进行细致、实时和大规模的观察——理想状态是三者同时实现。这曾经是个不可能实现的目标,但三项新发展令这个目标变得触手可及。

首先是高分辨率卫星图像的可获得性。20世纪90年代中期,经济学家艾历克斯•普法夫(Alex Pfaff)的意识到,这些图像可用于回答关于亚马逊地区开发项目与毁林之间联系的相关问题。

此后很多人都曾效仿。卫星可以轻松测量夜间照明,这是跟踪经济活动和城市发展模式的简单方法。还有可能测量各种空气污染,以及观察作物的生长。

算法正开始大规模提取细微的信息:埃塞俄比亚有多少住宅有铁皮屋顶?肯尼亚的哪些道路状况良好?与此同时,价格越来越便宜的小型卫星每天都在拍摄地球上各个角落的高分辨率照片。

一个更大的变化是经济学家正在使用行政管理数据。我当然意识到“经济学家正在使用行政管理数据”足以角逐2018年度最无聊的句子。但在过去20年左右期间,此举悄然掀起一场革命。

行政管理数据是政府或私营公司为完成工作而产生的数字。

学校记录出勤率和成绩。税务机关知道你(申报)的收入——而且还知道你住哪里、什么年纪、可能还知道你的孩子们是谁。

随着这些记录逐渐数字化,它们能被用来解答研究中的严肃问题。例如,税收数据可以告诉我们:富人或穷人家的孩子,长大后会在多大程度上成为富人或穷人。

这些细节数据现在处于实证经济研究的最前沿。据戴夫•唐纳森(Dave Donaldson,他跟杜夫洛教授一样是麻省理工学院经济学教授、约翰•贝茨•克拉克奖章获得者)表示:“在我研究的国际贸易领域,我很少看到哪篇论文会不使用海关级别的数据。每批货都会生成一份记录,说明货物是什么、从哪里来、运往何处,以及缴纳的税款。”

第三件测量工具是移动电话,每次拨打电话,电话公司都会生成一个记录,谁打给谁、什么时间、通话多久,以及电话双方位置在哪,有时能精确到100米以内。

有了这种“元数据”,经济学家和其他研究者可以研究各种课题,例如:人们的移动速度有多快,以及这会在多大程度上与流行病传播相关?一个城市的交通基础设施运作是否良好?难民融入新的社会的速度有多快?

这对经济学家来说既是机遇,也是挑战。数据科学家和经济学家乔什•布鲁门斯多克(Josh Blumenstock)告诉我,“任何一个毕业超过五年的经济学博士都不知道该怎么处理这些数据,他们在拼命补课。”

当然,临时抱佛脚也有产生成果的时候。终于,经济学家们不仅能够理论化马歇尔所称的“日常生活事务”,还能观察它。我们的工具让我们看到了新的东西——而我们的所见决定了我们的所思。
来源:大数据世界
CPDA数据分析师海报